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摘 要 : 针对 旋转 机 械 故 障 辩 识 准确 率 偏 低 的 问题 ， 将 集合 经 验 模 态 分 解 (ensemble empirical mode decomposition ， 
EEMD) 与 能 量 矩 、 邻 域 粗糙 集 (neighborhood rough set，NRS) 进 行 结 合 提 出 一 种 转子 系统 故障 模式 办 识 的 方法 。 首 先 
利用 EEMD 将 采集 到 的 振动 故障 信号 自 适应 分 解 成 若干 个 平稳 的 本 征 模 态 函数 (intrinsic mode function，IME) 分 量 并 
计算 其 能 量 矩 ; 以 此 能 量 答 作为 描述 故障 状态 的 条 件 属 性 建立 故障 识别 决策 表 ， 然 后 利用 邻 域 粗 糙 集 对 决策 表 进 行 
属性 约 简 消 除 完 余 的 属性 ; 最 后 将 约 简 后 的 敏感 特征 子 集 输入 所 设计 的 决策 树 (decision tree，DT)C4.5 算法 中 进行 
模式 识别 。 通 过 典型 转子 实验 台 的 故障 特征 集 验 证 了 该 方法 的 有 效 性 。 
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Rotor fault data set classification method based on EEMD energy moment and 
neighborhood rough sets 


Sun Zejin, Zhao Rongzhen 
(School of Mechanical & Electronical Enginnering, Lanzhou University of Technology, Lanzhou 730050, China) 


Abstract: Aiming at the problem of low recognition accuracy of rotating machinery faults, this paper proposed a rotor 
system fault identification method based on the combination of ensemble empirical mode decomposition (EEMD) with 
Energy Moment and neighborhood rough sets (NRS) . Firstly, the method used the EEMD to decompose decompose the 
non-stationary vibration signal into several stable intrinsic mode functions (IMF) and calculated the energy moment of the 
IMF component. Using this energy moment as the condition attribute to describe the fault state to establish the fault 
identification decision table, then us the neighborhood rough set to perform attribute reduction on the decision table to 
eliminate the redundant attribute. Finally, using the reduced sensitivity feature subsets as input into decision tree C4.5 
algorithm for recognition. 

Key words: ensemble empirical mode decomposition; intrinsic mode functions; energy moment; decision table; 


neighborhood rough set; attribute reduction; decision tree C4.5 algorithm 


0 ”引言 并 且 多 域 特征 的 引入 使 得 多 元 宛 余 信 息 渗入 其 中 ， 最 终 导 致 
(ae 本 故障 识别 的 准确 率 不 高 。 因 此 需 用 维 数 约 简 方法 对 特征 数据 
和 旋转 机 械 中 转子 故障 的 危害 性 巨大 ， 由 于 转子 通常 在 多 ”进行 有 效 的 二 次 特征 提取 ,提取 出 低 维 敏感 的 主要 特征 矢量 。 
三 ” 振 源 环境 运转 ， 传 统 的 单一 诊断 模式 难以 全 面 、 准 确 地 获取 经 验 模 态 分 解 [J(empirical mode decomposition,EMD) 是 
故障 特征 止 ， 因 此 ， 多 通道 信号 构建 故障 数据 集 对 智能 诊断 Huang 等 人 提出 的 一 种 新 的 具有 自 适应 性 的 时 频 分 析 方 
技术 的 发 展 具有 积极 的 促进 作用 。 但 这 种 多 通道 融合 的 高 维 ” 法 ， 可 以 根据 信号 的 局 部 时 变 特性 进行 自 适应 的 时 频 分 解 ， 
故障 特征 集 往 


主 会 不 可 避免 地 掺 杂 匈 余 属性 ， 这 无 疑 会 增加 ”非常 适合 对 非 线 性 、 非 平稳 信号 进行 特征 提取 ,但 目前 的 


和 
分 类 器 学 习 、 训 练 时 间 ， 甚 至 降低 分 析 处 理 的 精度 说。 故人 全 ”EMD 分 解 存 在 着 端点 效应 和 模 态 混 靶 现象 。 为 解决 此 问题 ， 
看 挖掘 出 敏感 的 故障 特征 信息 、 剔 除 元 余 属 性 ， 对 于 提高 故 ”Wu 和 Huang 等 人 在 EMD 方法 的 基础 上 引入 噪声 辅助 分 析 ， 
障 识别 的 精度 尤为 重要 1。 是 出 的 集合 经 验 模 态 分 解 昌 (EEMD) 方法 既 能 达到 与 EMD 
前 , 文献 [和 提出 的 基于 邻 域 粗糙 集 的 属性 约 减 给 维 数 。” 相同 的 分 解 目 的 ， 又 能 有 效 地 抑制 模式 混 针 站。 

灾难 提供 了 一 种 良好 的 解决 办 法 ， 但 是 对 于 条 件 属性 的 选择 为 实现 邻 域 粗 糙 集 属性 约 简 后 低 维 矢量 与 故障 类 型 间 的 
仍 待 进一步 研究 。 文 献 [3] 提 出 了 一 种 基于 EMD 与 邻 域 粗糙 。 ”快速 识别 ， 需 选择 出 一 种 简单 、 高 精度 的 智能 分 类 器 。 通 过 
集 的 液体 电磁 阀 故障 诊断 方法 ， 并 在 实验 中 证 明了 该 方法 的 。 某 种 测量 规则 来 评估 训练 样本 和 测试 样本 间 的 相似 性 ， 然 后 
有 效 性 。 文 献 [6] 运 用 EMD 分 解 后 IMF 能 量 矩 构造 特征 向 量 ”根据 规则 选择 邻近 的 样本 ， 在 这 些 近邻 样本 点 中 哪 一 种 类 型 
实现 了 对 滚动 轴承 故障 的 精确 诊断 ， 但 当 EMD 对 多 模 态 混 用 有 的 点 多 ， 测 试 样本 就 属于 这 一 类 型 。 通 过 找 出 与 其 最 近 
合 的 复杂 信号 进行 分 解 时 ， 容 易 造 成 IMF 分 量 模 态 混 闭 , 导 ”的 已 知 标 签 的 信息 的 样本 ， 将 给 标签 信息 赋予 待 分 类 样本 ， 
致 分 解 精度 不 高 , 致使 部 分 IMF 分 量 的 能 量 矩 不 能 准确 地 拱 即 故 障 识别 。 决 策 树 05 以 其 简单 直观 ， 分 类 特性 好 等 优点 ， 
述 其 工作 状态 ， 尚 存在 转子 故障 类 型 辨识 精度 不 够 高 的 问题 。 在 故障 诊断 方面 得 到 了 广泛 应 用 。 

有 待 解决 ， 而 且 在 转子 系统 的 故障 识别 还 有 待 进一步 研究 。 依据 上 述 分 析 , 本 研究 提出 一 种 基于 EEMD 能 量 矩 与 邻 
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孙 泽 金 ， 等 : 基于 EEMD 能 量 和 天 与 邻 域 粗 糙 集 的 转子 故障 数据 集 分 类 方法 


域 粗糙 集 和 决策 树 算法 相 结合 的 转子 故障 数据 分 类 方法 ， 借 


助 EEMD 能 够 有 效 获得 转子 振动 信号 的 特征 分 布 类 型 , 利用 
分 解 后 所 得 IMF 分 量 通过 能 量 矩 指标 选 出 含有 故障 信息 的 
IME 分 量 ， 构 造 转子 故障 分 类 的 特征 向 量 和 矩阵， 运 | 
烽 集 在 属性 约 简 上 的 优势 和 决策 树 算法 在 数据 分 类 上 的 优 
势 ， 运 用 到 转子 系统 的 故障 诊断 中 ， 为 转子 故障 数据 集 维 妆 


ChinaXiv 合 作 期 刊 


NsD = Usx 
汪 


] 邻 域 粗 


约 简 与 故障 分 类 提供 了 一 种 参考 途径 。 
1 ”相关 基本 原理 简介 
1.1 EEMD 的 信号 分 解 原 理 


EEMD 分 解 能 够 根据 信号 自身 的 特点 ， 自 
性 、 非 平稳 的 多 模 态 信号 分 解 为 若干 个 平稳 单一 模 态 的 IMF 


集 维 数 


适应 地 将 非 线 


分 量 和 一 个 余 项 I。 传统 的 EMD 方法 中 IMEF 分 量 的 不 连续 


造成 相 邻 波形 模 态 混 著 现象， 主要 是 由 以 下 两 个 原因 造成 
的 :a. 信 号 中 没有 足够 的 极 值 点 ， 造 成 分 解 的 停止 ，b. 采 用 三 


次 样 条 函数 对 信号 的 极 值 点 进行 拟 合 时 ， 极 值 点 分 布 间隔 的 
不 均匀 。 为 克服 上 述 缺 陷 ， 文 献 [89] 提 出 了 EEMD 分 解 方法 。 


该 方法 利用 高 斯 白 噪声 的 频率 均匀 分 布 的 统计 特性 弥补 上 述 


模 态 不 连续 的 缺陷 。 具体 EEMD 方法 的 分 解 过 程 可 参考 文献 


[10]。 


1.2 1IMF 能 量 和 矩 的 定义 


对 采集 到 的 


个 IMF 分 量 中 提取 转子 系统 的 故障 特征 
故障 信息 ,本 实验 计算 11 个 IMF 分 量 和 一 个 余 项 的 能 量 矩 。 


动 信号 进行 EEMD 分 解 可 得 到 若干 个 IMF 
分 量 和 一 个 余 项 。 研 究 文献 [11] 表 明 ， 转 子 系统 的 故障 信息 
主要 集中 在 靠 前 的 几 个 IMF 分 量 中 , 所 以 一 般 从 主要 的 前 几 


0 


赖 性 越 强 。 


公式 为 


NasX ={x |6pC) NX OneU)} 


NaX ={x,|6s(x) CX,x EU 
那么 决策 系统 的 边界 域 为 


BN(D) = NsD— NaD 


邻 域 决策 系统 的 正 域 和 负 域 分 别 为 


POS(D)=N,D 


NEGs =U —NsD 


决策 属性 D 对 条 件 属性 B 的 依赖 度 为 


IPOSs(D)| 
DY a 
7s(D) v 
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(4) 


(5) 
(6) 


(7) 


(8) 
(9) 


(10) 


依赖 度 反 映 了 系统 中 能 够 被 正确 分 类 的 样本 比例 ， 显 然 
<ys(D)<1 。 正 域 越 大 ， 表 明 决 策 属性 D 对 条 件 属性 B 的 依 


车 属性 ae8, 那 么 条 件 属性 a 对 于 决策 属性 D 


的 重 


Sig(a, B,D)= Yau (D)— 7s(D) 


属性 约 简 是 邻 域 粗 糙 集 理论 研究 的 核心 之 一 ， 


决策 表 分 类 能 力 不 变 的 条 件 下 ， 利 用 不 可 分 辨 关系 


FE 信 息 , 但 是 以 防 遗 漏 


a) 设 一 个 信号 序列 ， 计 算 这 个 信号 经 EEMD 处 理 后 分 


量 能 量 矩 如 式 (1 


m 为 采样 点 。 
b) 以 每 个 
障 状态 的 特征 向 


能 量 矩 在 机 械 信号 信息 量 评估 、 信 息 成 分 分 析 等 多 方面 
有 独特 性 能 , 它 与 传统 方法 中 采用 信号 的 能 量 或 能 


其 中 : 2% 为 本 征 模 函 数 ，Ar 为 采样 周期 ; 


) 所 示 。 


E=2,(m.:Anla(m-:An| ， i=1,2,3,.…,n (1) 


n 为 总 的 采样 点 数 ; 


IMF 分 量 的 能 量 矩 为 元 素 可 构造 一 个 描述 故 


量 7。 


2 [E, E:, Ea,: “EFE,] 


(2) 


量 粹 作为 


描述 转子 系统 特征 的 方法 相 比 ， 能 量 矩 既 可 反映 能 量 的 大 小 


又 可 反映 其 随时 


1.3 邻 域 粗糙 集 与 属性 约 简 的 概念 


Pawlak02 提 出 的 粗糙 集 理 论 (rough sets) 只 能 处 型 
精确 集 ， 对 数值 型 数据 必须 离散 化 后 才能 处 理 ， 


间 参 数 的 分 布 情 况 ， 能 够 更 好 地 揭示 能 量 分 
布 特性 和 信号 的 本 质 特征 , 有 利于 转子 系统 故障 特征 


是 取 9。 


he 


离散 的 


连续 数据 经 


过 离散 化 处 理 可 能 会 丢失 重要 信息 影响 最 终 的 处 理 效果 。 胡 


清华 等 人 (31 提 tH 


数据 集 ， 解 决 了 


tH 的 邻 域 粗粮 集 概念 可 以 直接 处 理 连续 性 的 


粗糙 集 在 处 理 连续 性 数据 必须 离散 化 这 一 必 
要 环节 条 件 ， 避 免 了 离散 化 带 来 的 信息 损失 。 


给 定 一 邻 域 决策 系统 NDT=<U,4,D> ， 其 中 非 空 有 限 集 
为) 是 实验 样本 集 ， 即 论 域 ，4= (aa) 是 


合 U=(0%3"5 


描述 论 域 的 全 部 条 件 属性 的 集合 ; D 是 分 类 决策 属性 ， 即 


故障 类 型 ， 根 据 D 的 属性 值 域 可 将 U 划分 为 N 个 等 价 类 ， 
U={X,X,,…,Xw} ，VB cA 生成 的 邻 域 关系 Ns , 则 决策 属性 D 


关于 条 件 属性 子 集 8 的 上 、 下 近似 分 别 为 


NaD = U NaX: 
党 


G3) 


局 


如 果 ss(w,&D>0， 则 属性 w 加 入 属性 约 简 子 集 
8=B8ut{a,} ， 转 至 步骤 b) 继 续 计算 ， 否 则 程序 终止 ， 输 
终 约 简 结果 。 

1.4 决策 树 算法 


C 


FE 约 简 子 集 B， 步 又 如 下 : 
a) 初始 化 属性 约 简 子 集 B= 纪 ; 


zf 


删除 


宛 余 属性 的 概念 ， 这 将 有 利于 按 弃 宛 余 属性 ， 降 低 数据 处 理 
的 时 间 和 空间 复杂 度 。 基 于 属性 重要 度 指标 ， 可 以 构造 贪心 
式 属性 约 简 算法 (4。 算 法 的 输入 为 NDT =<U,4.D> ,输出 为 属 


b) 对 于 任意 剩余 属性 ae 4-8， 计 算 该 属性 相对 于 约 简 
子 集 4 的 重要 度 : 


Sig(a, B,D)= Ysa(D)—7Ys(D) 


(12) 


c) 选择 重要 度 最 大 的 属性 Sig(aj,8,D)=max(Sis(a,8,D))， 


B, 


LIH 是 
山 取 


决策 树 是 一 个 应 用 广泛 的 分 类 算法 ， 它 的 核心 算法 是 


4.5 算法 , C4.5 算法 是 


Quinlan 在 ID3 算法 的 基础 上 提出 


的 03。 决 策 树 的 核心 问题 是 测试 属性 的 选择 与 决策 树 的 修 


人 
剪 。 


C4.5 算法 采用 信息 


的 不 足 na。 
基于 EEMD 能 量 矩 和 邻 域 粗 糙 集 的 故障 数据 集 


2 


2. 


糙 集 理论 一 项 重要 的 应 用 ， 邻 域 粗 糙 集 弥补 了 经 


分 类 方法 设计 


是 邻 


息 增 益 率 来 作为 选择 分 支 属性 标准 ， 殉 
服 了 ID3 算法 中 信息 增益 选择 属性 时 偏向 选择 取 值 多 的 属性 


1 基于 EEMD 能 量 矩 和 邻 域 粗 糙 集 的 故障 诊断 方法 设计 
由 于 1.1 和 1.2 节 分 别 对 EEMD 分 解 过 程 ， 高 维特 征集 
的 构造 过 程 做 了 详 述 ， 本 节 不 在 做 详 述 。 属 性 约 简 


域 粗 


粗糙 


集 理 


2 


论 中 处 理 连续 型 数据 要 先进 行 离散 化 的 缺陷 ， 经 过 邻 域 粗糙 


EE 


E， 有 利于 之 后 进行 故障 的 分 类 。 


集 的 约 简 删除 了 数据 中 的 元 余 特 征 ， 降 低 了 数据 处 理 的 复杂 


依据 EEMD-NRS 算法 原理 设计 转子 系统 故障 诊断 流程 


201812.00109v1 
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作为 邻 域 粗 糙 集 的 条 


如 图 1 所 示 。 


高 维特 征 向 


2 


图 1 基于 eemd 能 量 矩 与 邻 域 粗 糙 集 理论 的 故障 诊断 流程 图 
Fig. 1 


Flow chart of fault diagnosis based on EEMD energy moment 
and neighborhood rough set theory 

算法 具体 步骤 如 下 : 

a) 对 采集 的 不 平衡 、 不 对 中 、 碰 磨 、 松 动 和 正常 5 种 状 
态 信号 进行 EEMD 分 解 ， 分 别 得 到 若干 个 IMF 分 量 和 一 个 
余 项 。 

b) 运 用 
分 量 的 能 量 矩 为 元 素 的 向 量 E=(E1，E2， 
故障 状态 的 特征 向 量 。 
co) 运用 特征 向 量 和 矩阵 构造 高 维特 征集 ， 生 成 决策 表 ， 
运用 邻 域 粗糙 集 对 决策 表 进 行 属性 约 简 ， 根 据 式 (11) 计算 
每 个 条 件 属性 的 重要 度 Sig(aj,8,D) ， 从 中 选择 属性 重要 度 较 
大 的 属性 集合 加 入 约 简 集 合 中 。 

d) 将 约 简 后 的 低 维 敏感 特征 子 集 作 为 输入 ， 对 样本 集 进 
行 训练 构建 决策 树 模型 ， 进 行 故障 类 型 识别 。 


3 ”应 用 结果 分 析 


本 项 工作 所 使 用 的 故障 数据 集 源 于 文献 [17] 中 所 示 的 转 
子 实验 台 。 实 验 数 据 选取 在 采样 频率 为 5000 Hz， 驱 动 
转速 为 2800r/min 下 采集 的 振动 信号 。 模 拟 如 下 四 种 典型 故 
障 : { 支 座 松 动 、 动 静 碰 摩 、 质 量 不 平衡 和 轴 系 不 对 中 }， 以 及 
常 状态 下 的 实验 。 

3.1 提取 的 故障 特征 的 状况 
实测 得 到 的 4 种 故障 和 正常 状态 下 原始 振动 信号 的 时 域 
波形 图 如 如 图 2 所 示 《〈 由 于 篇 幅 有 限 仅 列 出 不 对 中 状态 下 的 
第 一 个 通道 的 原始 振动 信号 ) 。 对 图 2 信号 进行 特征 提取 分 
析 ， 对 每 种 状态 的 每 一 通道 ( 共 12 通道 ) 的 振动 信号 进行 
EEMD 处 理 ， 为 选取 含有 故障 信息 的 真实 特征 分 量 引 入 能 量 
和 矩 评价 指标 ， 本 文 以 信号 长 度 为 2 048 点 的 不 对 中 故障 数据 
为 例 进行 评价 方法 说 明 。 本 实验 中 EEMD 的 辅助 白 噪声 标准 
差 设 为 原始 标准 差 的 0.2 倍 且 M =100。 以 不 对 中 的 故障 信号 
个 


式 (1) 计算 各 IMEF 分 量 的 能 量 矩 ， 构 造 以 各 IMF 
…，Em) 作为 转子 


为 例 ， 其 分 解 结果 的 如 图 3 所 示 。 可 以 看 出 分 解 出 的 11 
IMF 分 量 和 一 个 余 项 运用 式 (1) 计 算 这 12 个 分 量 的 能 量 矩 。 
图 4 可 以 看 出 分 解 出 的 11 个 IMF 分 量 和 一 个 余 项 的 


能 量 各 不 相同 ,因此 实验 中 为 避免 遗漏 故障 信息 选取 12 个 分 
量 的 能 量 矩 建立 其 诊断 模型 。 每 种 故障 各 采集 50 组 样本 , 加 
上 正常 状态 共 250 组 ， 生 成 决策 表 ， 将 得 到 的 能 量 矩 特征 设 
置 为 决策 表 中 的 条 件 属 性 ， 而 决策 属性 值 1， 2，3，4，5 分 
别 对 应 着 不 对 中 、 不 平衡 、 碰 磨 、 松 动 和 正常 五 种 状态 ， 然 
后 对 决策 表 进 行 属性 约 简 ,如 表 1 所 示 。 在 表 1 中 ,将 al~al44 


型 ， 


9 邻 域 值 计算 各 属性 


通常 情 况 下 》 


将 该 列 作 为 邻 域 粗糙 集 的 决策 属 1 
根据 式 (13) 可 得 到 邻 域 大 
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# 本 故障 类 


件 属性 。 表 中 最 后 一 列 是 各 村 


i 


生 。 


的 重要 度 ， 表 2 为 根 扩 


域 半径 大 小 对 本 文 所 提 方 法 的 影响 。 


用 来 调 


在 不 同 的 属性 重要 度 
且 当 重要 度 下 限 为 0.01， 


用 中 


邻 域 大 小 ,不 
值 在 2~4 之 间 由 。 如 表 
步 长 为 0.1 取 值 ， 得 至 
约 简 后 的 结果 输入 到 决策 树 分 类 器 


6(2,)= 


同 的 4 对 应 不 同 的 邻 域 3 
2 所 示 , 为 使 得 诊断 结果 最 佳 
径 和 约 简 集合 ， 
Ph， 对 比分 类 
F 限 ， 当 2<4<4 时 得 到 的 约 简 属性 不 
4=3 得 到 的 分 类 效果 最 


上 不同 的 邻 域 


Std(2,) 
亏 


， S14(Z) 表示 属性 Zz 的 标准 差 ，4 是 一 个 设 定 


小 9。 选择 
届 式 (13) 得 出 


也 


二 给 
结果 ， 


适 


全 
品 
的 邻 


(13) 


的 参数 ， 
E 径 ,通常 4 取 
,对 4 以 
将 属性 


发 现 


2500 


E 1 
E 0 
2 上 上 上 上 
0 500 1000 1500 2000 
采样 点 数 
图 2 不 对 中 状态 原始 振动 信号 时 域 波 形 图 
Fig.2 Unbalanced waveform diagram of original vibration signal 
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录用 定稿 孙 泽 金 ， 等 : 基于 EEMD 能 量 矩 与 邻 域 粗糙 集 的 转子 故障 数据 集 分 类 方法 
400 400 400 
300 300 300 
草 于 加 
演 200 池 200 洱 200 
tL UL LL 
三 三 三 
100 100 100 
123456789101112 123456789101112 123456789101112 
IMF IMF IMF 
(a) 不 对 中 状态 下 的 IMF 能 量 矩 (b) 不 平衡 状态 下 的 IMF 能 量 矩 (c) 人 碰 磨 状态 下 的 IMF 能 量 矩 
(a)IMF energy moment in misaligned state (b) IMF energy moment in unbalanced state (c) IMF energy moment in the state of rubbing 
400 400 
300 300 
寻 虽 
再 对 
池 200 池 200 
LL LL 
三 三 
100 100 


经 过 式 (10) 计算 各 条 件 


法 输出 


123456789101112 


IMF 


(d) 松动 状态 下 的 IMF 能 量 拢 


(d)IMF energy moment in loose state 


图 


123456789101112 


IMF 


Ce) 正常 状态 下 的 IMF 


(e) IMF energy moment under normal conditions 


4 五 种 运行 状态 转子 系统 的 imf 能 量 矩 


能 量 矩 


Fig.4 Five operating state rotor Systems of the IMF energy moment 


的 最 佳 特征 约 简 集合 为 A={a4,a41,al13 } 。 


组 术 


fF 本 随机 


(ul 


属性 的 依赖 度 ， 经 属性 约 


构造 决策 树 。 对 采集 到 的 250 组 样本 进行 训练 ， 将 
分 配 ， 利 用 MATLAB 中 randpern 函数 随机 的 产 


简 算 


250 


生 1~250 里 的 250 个 随机 数 ， 


好 的 其 中 的 站 


1 1~250 随机 排列 ， 并 将 分 配 


1 200 组 作为 训练 村 


本， 后 50 组 作为 测试 样本 ， 


进行 和 


验 ， 


分 别 进 


比 情况 如 图 5、 表 3 所 示 。 


且 重 复 10 次 。 为 对 比 本 方法 的 故障 识别 效果 ， 


行 EMD 分 解 和 EEMD 分 解 ， 两 种 方法 分 类 的 效果 对 


区 


5 (a) ~ 〈d) 分 别 为 经 过 邻 域 


粗糙 集约 简 前 的 和 约 简 后 的 样本 数据 构建 的 决策 树 模型 分 类 


效果 图 。 表 3 为 约 简 前 后 两 种 状态 分 别 的 诊断 结果 。 
表 1 邻 域 粗 糙 集 约 简 前 后 决策 表 
Table 1 The decision table of before and after neighborhood rough set 
reduction 
条 件 属性 A 
论 域 U 决策 属性 D 
al al43 al44 
X1 399.9463064 … 2.40E-05 0.000910257 
X2 398.7100662 … 3.52E-05 0.032099994 1 
X50 371.5186968 … 3.73E-05 0.003479771 1 
X51 375.3482159 … 0.000265156 0.021435881 
X52 373.7751872 … 2.51E-05 0.011634109 
X100 346.8086636 … 1.88E-05 0.004901061 2 
X101 416.1019829 … 0.000173613 0.018313799 3 
X102 416.5391071 … 3.78E-05 0.000305911 3 
X150 395.3598894 … 6.30E-05 0.007640982 3 
X151 387.5289057 … 2.73E-06 0.001246808 4 
X152 


397.9059451 … 


2.56E-05 


0.002932133 


续 表 1 
条 件 属性 A 
论 域 U 决策 属性 DD 
al al43 al44 
X200 386.9643172 … 6.26E-05 0.002238621 4 
X201 384.907661 1.32E-06 0.000589699 :| 
X202 384.51924 3.32E-06 0.006747133 9 
X250 357.9463479 … 1.08E-05 0.000853535 5 
条 件 属性 A 
论 域 U 决策 属性 DD 
a4 a41 al13 

X1 208.6148243 0.769946499 40.97690549 
X2 204.7683621 0.708904934 40.14830871 1 
X50 208.09656290.647715298 35.72159452 1 

X51 196.0292805 0.172987719 18.37092258 

X52 197.8483438 0.188093117 18.39926765 
X100 181.4118473 0.186883806 17.9426854 2 

X101 236.5492809 8.178644296 25.93239708 
X102 231.74183637.966704938 23.04836196 3 
X150 231.7128948 8.448036544 20.57047662 3 
X151 214.0489429 0.802180488 9.167763727 4 

X152 219.6973014 0.81866692 8.785644878 
X200 218.06565910.495887547 14.57934126 4 
X201 207.4295415 0.978091065 20.24057998 5 
X202 205.2768108 0.955028334 16.34523332 3 
X250 193.54850470.937404312 15.87132204 5 
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国 
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表 2 不 同 可 


孙 泽 金 ， 等 : 基于 EEMD 能 量 和 天 与 邻 域 粗糙 集 的 转子 故障 数 


前 用 了 4 个 属性 值 才 将 五 种 状态 
3 个 属性 值 就 将 所 有 的 状态 区 分 3 


要 度 和 入 下 的 分 类 精度 对 比 


Table 2 Comparison of classification accuracy under different 


importances and 入 


4 0.1 ”分 类 精度 


分 类 精度 0.001 分 类 精度 


过 4 100 100 6 97.8 
5 3 95.6 95.1 4 95.1 
3 3 100 100 4 100 
3.5 3 98 98 3 98 
4 3 98 98 3 98 
从 图 5 (a) ~ (d) 可 知 ， 经 过 EEMD 分 解 的 约 简 前 后 
虽然 叶子 节点 都 是 四 个 ， 构 造 的 树 的 大 小 也 相同 ， 但 是 约 简 


aEEMD-DT 


表 3 邻 域 粗 糙 身 


x3< 29.1597, 3 >= 29.1597 
3>= 15287 


x1< 215.014 1>=215.014 


b)EEMD-NRS-DT 


dn 


据 集 分 类 方法 


区 分 


子 节点 是 四 个 ， 而 约 简 后 叶子 节点 是 三 个 ， 并 且 约 
4 个 属性 值 才 将 五 种 状态 区 分 玫 


将 有 用 的 混 闪 在 一 起 


性 值 就 将 所 有 的 状态 区 分 开 。 
EEMD 分 解 的 识别 了 
EMD 分 解 时 会 造成 IMF 分 量 肖 


E 确 率 高 于 E 


j 从 表 2 上 


二 < 
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属性 值 一同 


在 构造 决策 树 模型 时 所 需要 的 叶 


EEMD 少 ， 但 是 最 终 的 故障 识别 ; 


c)EMD-DT 


攻 约 简 前 后 的 识别 准确 率 


Table 3 Methods of before and after the neighborhood rough set 


reduction of recognition accuracy 


图 5 两 种 方法 约见 前 后 决策 树 示意 图 
Fig.5 Schematic diagram of the decision tree before and after the neighborhood rough set reduction 


的 大 小 ， 能 够 在 较 短 的 时 间 内 对 大 型 数 扩 


各 类 状态 平均 识别 率 /% 平均 识 


方法 


不 对 中 不 平衡 


别 时 间 


碰 磨 ”松动 ”正常 
/s 


EEMD-NRS-DT 100 
EEMD-DT 97.1 
EMD-DT 83.3 
EMD-NRS-DT 72.5 


100 100 100 0.952 
95.9 99.1 100 0.972 
100 100 85.7 1.56 
54.1 357.1 48.6 1.28 


chinaXiv 


为 进一步 验证 EEMD-NRS-DT 方法 钊 


在 选取 不 同 训练 样本 数量 情况 
种 模式 识别 方法 经 属性 约 简 


的 BP 记 


可 以 看 出 : a) 不 论 是 决策 村 


对 的 优越 性 , 本文 
经 网 络 、 决 策 树 2 
后 的 低 维 矢量 以 及 原始 高 维特 征 


T 


集 在 BP 神经 网 络 和 决策 树 的 识别 结果 如 表 4 所 示 。 从 表 4 
方法 还 是 神经 网 络 方法 ， 特 生 


FE 约 


简 后 ,识别 效率 都 有 


了 系统 的 效率 ;b) 决 策 树 的 
这 是 因为 常规 的 BP 神 


需要 大 量 的 参数 ， 如 网 络 
其 采用 梯度 下 降 法 , 存在 易 陷 
收敛 速度 较 慢 的 缺陷 ， 并 
有 一 种 统一 而 完整 的 指 * 


策 树 易 于 理解 和 解释 


j 且 综合 确诊 率 并 没有 明显 


降 ,原因 是 经 过 邻 域 粗 糙 集 属 | 


7 


9 简 消 除了 元 余 的 特征 ,提升 


准确 率 要 高 于 BP 神经 网 络 ， 


且 BP 记 


看 做 一 个 “黑箱 ”， 内 部 结 
构 未 知 ， 故 其 学 习 过 程 不 能 观察 ， 输 出 结果 难以 解释 ， 而 且 
石 扑 结 构 、 权 值 和 闵 值 的 初始 值 
局 部 极 小 值 , 训练 时 
经 网 络 结构 的 选择 至 今 没 


好 的 处 理 结果 。 


通过 对 比 EMD-NRS-DT 和 
可 知 , 运用 EEMD 能 量 


转子 系统 的 故障 是 合理 的 。 


表 4 


I 除 造成 信息 
子 节 点 和 条 件 属 性 


确 率 却 相对 较 低 。 


x2< 17.9747/Ax2 >= 179747 


d)EMD-NRS-DT 


EEMD-NRS-DT 的 分 类 结果 
E 和 邻 域 粗糙 集 这 一 诊断 模型 对 诊断 


样本 数 对 应 的 识别 准确 率 /% 


A 


简 前 用 ] 
fF 来， 而 约 简 后 只 用 了 2 个 属 
P 可 以 看 出 经 过 
MD 分 解 ， 这 样 的 原因 是 
昆 登 在 进行 属性 约 简 时 就 会 
的 缺失 ， 虽 然 
E 值 相对 


Ff 来 ， 而 约 简 后 只 用 了 
下 ,经 EMD 分 解 的 约 简 前 叶 


居 源 作出 可 行 而 且 很 


Table 4 Recognition accuracy of different sample numbers 


间 较 长 》 


管 法 训练 样本 数目 / 测试 样本 数 
100/150 150/100 200/50 
EMD-DT 88.7 85.0 85.7 
EMD-BP 74.5 78.9 84.7 
EEMD-DT 91.9 93.0 96.7 
EEMD- BP 85.3 95.5 94.8 
EMD-NRS-DT 59.6 67.0 90.7 
EMD-NRS-BP 13.2 12 87.3 
EEMD-NRS-BP 98.2 98.9 99.2 
EEMD-NRS-DT 100 100 100 
4 ”结束 语 


a) 为 了 能 有 效 地 让 


中 


别 率 ， 本 文 提出 了 


] EEMD 能 量 外 


转子 系统 的 


结合 的 方法 。 通 过 实验 ， 模 拟 转 子 系统 的 五 种 状态 : 


支 座 松动 、 动 静 碰 摩 、 质 量 不 


许多 分 类 算法 对 于 数据 属 


一 般 化 处 理 后 才 可 以 应 用 


Ee” 


数值 属性 再 进行 处 理 , | 
树 是 一 个 “ 白 箱 ” 模 型 


j 决 策 树 无 须 居 


于 决策 树 可 以 对 有 商 性 的 数 ] 


更 地 推导 相应 的 逻辑 规则 。 


和 股 只 能 由 经 验 选 定 ， 而 决 
| 数据 的 准备 要 求 不 高 ， 而 其 他 的 
性 有 一 定 的 约束 性 ， 要 对 数据 进行 
神经 网 络 还 需 将 离散 所 
性 的 转换 。 另外 决策 


性 转换 为 


据 集 构造 决策 树 ， 所 以 可 
以 很 好 地 扩展 到 大 型 数据 库 中 ,同时 它 的 大 小 独立 于 数据 库 


衡 和 和 


方法 对 转子 系统 振动 信号 进行 故障 诊断 的 合理 性 。 
b) 针 对 分 解 得 到 的 IMF 分 引 
用 邻 域 粗糙 集 贪心 式 属性 约 简 算法 对 条 件 属性 集 进行 约 简 。 
最 后 利用 约 简 后 的 属 诉 | 各 

模型 的 诊断 准确 率 达 至 
c) 基 于 EEMD 能 量 矩 和 令 


E 子 集 建立 坟 
| 100% 


故障 ， 提 高 故障 的 识 
E 和 和 邻 域 粗糙 集 、 决 策 树 相 


中 存在 大 量 的 见 余 信息 


AR 策 树 。 经 过 
到 了 预期 的 效果 。 
昌 粮 集 相 结合 的 属 怕 


了 域 六 


FE 约 简 故 


障 分 类 模式 通过 转子 实验 台 故 障 数据 集 的 实验 结果 表明 ， 与 


传统 EMD 邻 域 粗糙 集 的 诊 浊 


方法 相 比 ， 本 研究 所 提出 的 诊 


录用 定稿 


断 模式 故障 辨识 效果 更 好 ， 能 为 复杂 旋转 机 械 故 障 诊断 的 智 
能 化 诊断 提供 了 一 种 解决 思路 。 
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